Toda empresa tem um sistema para gerenciar suas vendas. Na Hotmart não é diferente, ela possui um sistema paga gerenciar as vendas de seus produtos, onde nela é organizado de forma bem clara informando quem produziu o conteúdo, quando produziu, quem comprou, por onde foi feita a compra, a data da compra e muito mais. Através disso, fizemos uma análise encima desses dados para encontrar padrões entre eles.
Durante sua avaliação, você irá analisar dados referentes a uma
amostra de compras feitas na Hotmart em 2016. Tratam-se de mais de
1.599.828 registros de compras realizadas em nossa
plataforma. Abaixo, nós iremos detalhar o que significa cada campo:
purchase_id: Identificação da compra na Hotmart;product_id: Identificação do produto na Hotmart;affiliate_id: Identificação do afiliado na
Hotmart;producer_id: Identificação do produtor na Hotmart;buyer_id: Identificação do comprador na Hotmart;purchase_date: Data e hora em que a compra foi
realizada;product_creation_date: Data e hora em que o produto foi
criado na Hotmart;product_category: categoria do produto na Hotmart.
Exemplo: e-book, software, curso online, e-tickets, etc.;product_niche: nicho de mercado que o produto faz
parte. Exemplo: educação, saúde e bem-estar, sexualidade, etc.;purchase_value: valor da compra. Esse dado, assim como
nicho e categoria foi codificado para manter a confidencialidade. O
valor apresentado no dataset é o z-score do valor real;affiliate_commission_percentual: percentual de comissão
que o afiliado receberá da compra;purchase_device: tipo de dispositivo utilizado no
momento da compra, como: Desktop, Mobile, Tablet, ou Outros;purchase_origin: endereço do site do qual a pessoa veio
antes da compra. Por exemplo, se uma pessoa veio do Facebook, Youtube,
ou até mesmo de outra página no site oficial do produto;is_origin_page_social_network: informa se essa compra
veio de uma URL do Facebook, Youtube, Instagram, Pinterest, ou
Twitter| purchase_id | product_id | affiliate_id | producer_id | buyer_id | purchase_date | product_creation_date | product_category | product_niche | purchase_value | affiliate_commission_percentual | purchase_device | purchase_origin | is_origin_page_social_network | Venda |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1663958 | 6640 | 209372 | 116238 | 1200397 | 2016-06-26 12:00:00 | 2011-03-19 15:47:36 | Video | Presentation skills | -0.265302 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 1677087 | 2350 | 141418 | 2821 | 1083764 | 2016-06-26 12:00:00 | 2010-07-05 01:50:15 | Podcast | Child psychology | -0.177077 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017360 | 35669 | 618642 | 618642 | 1436106 | 2016-06-26 12:00:00 | 2012-06-13 02:59:37 | Podcast | Presentation skills | -0.468989 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017379 | 57998 | 1164511 | 70388 | 1436118 | 2016-06-26 12:00:00 | 2013-05-07 08:51:31 | Podcast | Anxiety management | -0.401168 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017382 | 58329 | 1261488 | 221253 | 1386357 | 2016-06-26 12:00:00 | 2013-05-12 08:12:06 | Podcast | Teaching English | -0.452489 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017387 | 17889 | 354805 | 192982 | 1274423 | 2016-06-26 12:00:00 | 2011-12-18 09:31:54 | Phisical book | Online course creation | -0.503716 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017442 | 36468 | 186897 | 186897 | 1252324 | 2016-06-26 12:00:00 | 2012-06-25 19:29:42 | Podcast | Presentation skills | -0.472931 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017522 | 53664 | 91695 | 91695 | 1436187 | 2016-06-26 12:00:00 | 2013-03-02 13:47:47 | Phisical book | Anxiety management | -0.288390 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017569 | 49928 | 86355 | 86355 | 4604 | 2016-06-26 12:00:00 | 2013-01-05 12:18:22 | Podcast | Media training | -0.528100 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
| 2017571 | 37250 | 616426 | 616426 | 1436199 | 2016-06-26 12:00:00 | 2012-07-03 18:02:17 | Podcast | Storytelling | -0.503697 | NA | Smart TV | Origin ef2b | 0,0 | 1 |
purchase_id product_id affiliate_id producer_id
Min. : 1663958 Min. : 4 Min. : 3 Min. : 3
1st Qu.:11653743 1st Qu.:112138 1st Qu.: 442241 1st Qu.: 409590
Median :12468488 Median :154310 Median :1690428 Median :1377289
Mean :12445457 Mean :148596 Mean :2297501 Mean :2164480
3rd Qu.:13233099 3rd Qu.:193934 3rd Qu.:3992235 3rd Qu.:3776238
Max. :14357203 Max. :319129 Max. :7700836 Max. :9868481
buyer_id purchase_date product_creation_date product_category
Min. : 60 Length:1599828 Length:1599828 Length:1599828
1st Qu.: 3730213 Class :character Class :character Class :character
Median : 5999154 Mode :character Mode :character Mode :character
Mean : 5187551
3rd Qu.: 6946337
Max. :12014792
product_niche purchase_value affiliate_commission_percentual
Length:1599828 Min. : -0.54124 Min. : 0.000
Class :character 1st Qu.: -0.45302 1st Qu.: 0.000
Mode :character Median : -0.35000 Median : 0.000
Mean : 0.00000 Mean : 7.596
3rd Qu.: 0.06492 3rd Qu.: 0.000
Max. :124.56100 Max. :100.000
NA's :199
purchase_device purchase_origin is_origin_page_social_network
Length:1599828 Length:1599828 Length:1599828
Class :character Class :character Class :character
Mode :character Mode :character Mode :character
Venda
Min. :1
1st Qu.:1
Median :1
Mean :1
3rd Qu.:1
Max. :1
O que percebemos no sumario? + As colunas purchase_date
e product_creation_date estão com formato de character em
vez de data. + A coluna affiliate_commission_percentual
contém 199 registros NA.
[1] 1599828
[1] 17883
[1] 22947
[1] 1100649
[1] 10
Aqui veremos uma lista dos 10 produtos mais vendidos.
| producer_id | product_id | vendas_produto |
|---|---|---|
| 6697083 | 219755 | 41220 |
| 3992235 | 130294 | 32731 |
| 442241 | 42903 | 27228 |
| 166090 | 63718 | 24132 |
| 464846 | 132809 | 23350 |
| 2307584 | 83377 | 21601 |
| 4580574 | 149048 | 16386 |
| 671256 | 59205 | 16096 |
| 3382787 | 154310 | 14455 |
| 3512 | 132454 | 11685 |
Como na base de dados não é fornecido os valores reais do produto, não sera possivel saber se os produtores que mais vendem são responsáveis pela maior parte do faturamento.
Podemos perceber que a quantidade de vendas de afiliados
27% das vendas em relação as do produtor. Sendo assim, o um
pouco mais de 70% do faturamento da Hotmart vem atraves do
proprios produtores do conteudo.
Para fazer essa avaliação, o mês base que foi utilizado foi o mês de janeiro.
| Meses | Quantidade |
|---|---|
| 2 | 160476 |
| 3 | 197719 |
| 4 | 181930 |
| 5 | 203702 |
| 6 | 173774 |
Observamos que a tacha de clientes novos ao longo dos meses e bem estável.
| Meses | Quantidade |
|---|---|
| 1 | 193362 |
| 2 | 143143 |
| 3 | 176551 |
| 4 | 161982 |
| 5 | 174750 |
Observamos que a quantidade de clientes que compraram apenas naquele mês especifico é um pouco grande.
Vamos visualizar um grafico com os dados dos clientes novos e com os cliente que so compraram uma unica vez
1 mil usuarios.As categorias são divididas em 10. vamos visualizar o grafico.
Podcast, Phisical Book,
Workshop.Phisical Book é a unica categoria que em todos os meses
ela ultrapassa os valores de 150 mil vendas.Video é a categoria menos vendida entre todas, não
passando de 50 vendas nos meses.eTicket e video são as categorias que mais
tem queda de vendas ao longo dos meses.app teve um crescimento de vendas a partir
do mês de fevereiro.Os nichos são divididos em 25 tipos. vamos visualizar o grafico.
Negociação e Anxiety management são os
nichos mais vendidos.Negociação e Anxiety management são as
únicas que ultrapassam as linha das 40 mil vendas.Immigration é o nicho com um dos maiores crecimento ao
longo dos meses.Presentation Skills e o único nicho que em todos em
meses tem basicamente a mesma quantidade de vendas, entre
21 mil e 26 milThermodynamics é o nicho que menos vendeu ao longo dos
meses.Quais os dispositivos mais utilizados para compras na plataforma?
A base de dados nos da uma lista de 5 dispositivos. Vamos observar o grafico.
Cellphone e tabletsão os dispositivos
menos utilizados.eReaders é o dispositivo mais utilizado, ultrapassando
a casa 120 mil. Em seguida vem Desktop com a
média de 96 mil dispositivos.Smart TV é o único dispositivo que vem com
crescimento.[1] TRUE